专利摘要:
ユーザ・エクスペリエンスを向上するために、背景雑音生成方法および雑音処理装置を提供する。本発明の方法は、取得された信号フレームが雑音フレームであれば、高帯域雑音符号化パラメータを該雑音フレームから取得し、第2の高帯域雑音符号化パラメータを取得するために重み付けおよび/もしくは平滑化を高帯域雑音符号化パラメータに実行し、該第2の高帯域雑音符号化パラメータによって高帯域背景雑音信号を生成する。雑音処理装置も提供する。
公开号:JP2011514561A
申请号:JP2011500033
申请日:2009-03-17
公开日:2011-05-06
发明作者:ダイ、ジンリァン;チャン、リビン
申请人:華為技術有限公司;
IPC主号:G10L19-00
专利说明:

[0001] 本発明は通信に関し、詳細には背景雑音生成方法および雑音処理装置に関する。]
背景技術

[0002] 現在のデータ伝送システムにおいて通信システムのキャパシティを増大するために、音声信号の伝送帯域幅を音声符号化技術によって圧縮することができる。音声通信のおおよそ40%の内容だけが音声を含み、その他の伝送内容は沈黙(silence)もしくは背景雑音のみであるので、伝送帯域幅をさらに節約するためにDTX(Discontinuous Transmission System)/CNG(Comfortable Noise Generation)技術が出現してきた。]
[0003] 従来技術のDTX/CNGにもとづく雑音生成方法は以下のステップを含む。]
[0004] 符号化側(装置)において、低サブバンド信号と高サブバンド信号とを出力するように、入力背景雑音信号をフィルタリングして2つのサブバンドに分割する。]
[0005] 狭帯域符号化パラメータおよび高帯域符号化パラメータを取得するために、2つのサブバンド信号を符号化する。2つのサブバンドの符号化パラメータを無雑音フレーム(non-noise frame)に結合する。DTXの現在の判断が「送信」であれば、高帯域符号化パラメータおよび狭帯域符号化パラメータをSID(Silence Insertion Descriptor)フレームに組み立てる。その後、復号化側(装置)にSIDフレームを送信する。DTXの現在の判断が「送信」でなければ、データを付加せずにNODATAフレームを復号化側に送信する。]
[0006] 受信符号化ビットストリームが狭帯域符号化パラメータだけを含むのであれば、復号化側における復号化は729Bの復号化方法によって実行される。この場合、符号化パラメータは第1の10msフレームのために使用され、第2の10msフレームはNODATAフレームとして処理される。]
[0007] 受信符号化ビットストリームに広帯域符号化パラメータがあれば(広帯域は高帯域および狭帯域を含む)、復号化処理は以下のステップを含む。]
[0008] 受信フレームがSIDフレームであれば、SIDフレームを復号化することによって、狭帯域符号化パラメータおよび高帯域符号化パラメータを取得する。狭帯域背景雑音および高帯域背景雑音は、狭帯域符号化パラメータおよび広帯域符号化パラメータによって生成される。]
[0009] 受信フレームがNODATAフレームならば、729Bの符号化方法によって狭帯域符号化パラメータを取得する。狭帯域背景雑音は729BのCNG方法によって取得される高帯域符号化パラメータは前の(previous)SIDフレームの高帯域符号化パラメータと同一であり(PWB=PWB_PRE_SID)、高帯域背景雑音がしかるべく生成される。]
[0010] しかしながら、上記技術的解決においては、NODATAフレームを受信した場合、前のSIDフレームの高帯域符号化パラメータを現在フレームの高帯域符号化パラメータとしてコピーするので、2つのSIDフレームの符号化の結果は完全に同一となる。2つの隣接するSIDフレームの符号化パラメータがかなり異なるのであれば、広帯域背景雑音どうしの差は大きくなるかもしれない。この場合、音声スペクトラムにおける「ブロック」効果が引き起こされ、ユーザに呼吸のような聴覚的効果をもたらすだろう。これにより、ユーザ・エクスペリエンスは悪化する。]
発明が解決しようとする課題

[0011] 本発明の実施形態は、ユーザ・エクスペリエンスを向上するための背景雑音生成方法および雑音処理装置を提供する。]
課題を解決するための手段

[0012] 本発明の実施形態による背景雑音生成方法は、取得した信号フレームが雑音フレームであれば、該雑音フレームから高帯域雑音符号化パラメータを取得し、第2の高帯域雑音符号化パラメータを取得するために該高帯域雑音符号化パラメータに重み付けおよび/もしくは平滑化を実行し、該第2の高帯域雑音符号化パラメータによって高帯域背景雑音信号を生成する。]
[0013] 本発明の実施形態による雑音処理装置は、信号フレームを取得するように構成されている信号フレーム取得ユニットと、該信号フレームから高帯域符号化パラメータを取得するように構成されているパラメータ取得ユニットであって、該信号フレームが雑音フレームである場合、該高帯域符号化パラメータが高帯域雑音符号化パラメータである、パラメータ取得ユニットと、取得した信号フレームが雑音フレームである場合、第2の高帯域雑音符号化パラメータを取得するために該高帯域雑音符号化パラメータに重み付けおよび平滑化の少なくとも一方を実行するように構成されているパラメータ処理ユニットと、該第2の高帯域雑音符号化パラメータによって高帯域背景雑音信号を生成するように構成されている雑音生成ユニットと、を備える。]
発明の効果

[0014] 上記技術的解決によれば、本発明の実施形態は以下の効果を有する。]
[0015] 本発明の実施形態では、信号フレームを取得した後、該信号フレームが雑音フレームであれば、該雑音フレームから高帯域雑音符号化パラメータを取得し、該雑音フレームによって高帯域雑音符号化パラメータに重み付けおよび/もしくは平滑化を実行する。すなわち、高帯域雑音符号化パラメータに平滑化を実行した後、および/もしくは周波数エンベロープに重み付けを実行した後、復元背景雑音の連続性が向上し、これにより、SIDフレームどうしの間の差異が比較的小さくなる。これによれば、「ブロック」効果を効果的に除去することができ、したがって、ユーザ・エクスペリエンスを向上することができる。]
図面の簡単な説明

[0016] 本発明の第1の実施形態による背景雑音生成方法のブロック図である。
本発明の第2の実施形態による背景雑音生成方法のブロック図である。
本発明の第3の実施形態による背景雑音生成方法のブロック図である。
本発明の実施形態による雑音処理装置のブロック図である。]
実施例

[0017] 本発明の実施形態は、ユーザ・エクスペリエンスを向上するために、背景雑音生成方法および雑音処理装置を提供する。]
[0018] 本発明の実施形態においては、信号フレームを取得した後、信号フレームが雑音フレームであるならば、雑音フレームから高帯域雑音符号化パラメータを取得し、雑音フレームによって重み付けおよび/もしくは平滑化を実行することによって処理する。すなわち、高帯域雑音符号化パラメータに平滑化が実行され、および/または、周波数エンベロープに重み付けが実行された後、復元背景雑音の連続性は向上し、これにより、SIDフレームどうしの間の差異が比較的小さくなる。これによれば、「ブロック」効果を効果的に除去することができ、したがって、ユーザ・エクスペリエンスを向上することができる。]
[0019] 図1には、本発明の第1の実施形態による背景雑音生成方法が示されている。該背景雑音方法は、以下を含む。] 図1
[0020] 101:取得した信号フレームが雑音フレームであるならば、雑音フレームから高帯域雑音符号化パラメータを取得する。]
[0021] 実施形態において、高帯域雑音符号化パラメータは時間(時間領域)エンベロープ・パラメータおよび周波数(周波数領域)エンベロープ・パラメータを含む。]
[0022] 信号フレームは符号化側で取得されてもよいし、復号化側で取得されてもよい。詳細については、以下の実施形態で議論し、ここではこれ以上議論しない。]
[0023] 102:第2の広帯域雑音符号化パラメータを取得するために、重み付けおよび/もしくは平滑化を高帯域雑音符号化パラメータに実行する。]
[0024] 雑音フレームが取得された後、第2の高帯域雑音符号化パラメータを取得するために、重み付けおよび/もしくは平滑化を雑音フレームの高帯域雑音符号化パラメータに実行する。特定の応用では、高帯域雑音符号化パラメータに加えて狭帯域雑音符号化パラメータも雑音フレームに含まれる。処理の詳細については以下の実施形態で例示する。]
[0025] 実施形態において、高帯域雑音符号化パラメータに平滑化を実行してもよいし、高帯域雑音符号化パラメータに重み付けを実行してもよいし、高帯域雑音符号化パラメータに重み付けおよび平滑化の双方を実行してもよい。重み付けおよび平滑化の双方を実行することによってよりよい結果が得られるかもしれない。]
[0026] 実施形態において、雑音フレームの高帯域雑音符号化パラメータに重み付けおよび/もしくは平滑化を実行することに加えて、音声フレームの高帯域音声符号化パラメータによって第2の高帯域雑音符号化パラメータに平滑化を実行してもよい。詳細については、以下の実施形態で議論する。]
[0027] 103:平滑化および/もしくは重み付けされた高帯域雑音符号化パラメータによって、高帯域背景雑音信号を生成する。]
[0028] 重み付けおよび/もしくは平滑化を符号化側で実行するならば、第2の高帯域雑音符号化パラメータおよび所定の狭帯域雑音符号化パラメータを復号化側に送信し、高帯域雑音符号化パラメータおよび狭帯域雑音符号化パラメータによって、背景雑音信号を復号化側で生成する。]
[0029] 重み付けおよび/もしくは平滑化を復号化側で実行するならば、符号化側から信号フレームを送信し復号化側で受信する。信号フレームの高帯域雑音符号化パラメータに重み付けおよび/もしくは平滑化を実行することによって、第2の高帯域雑音符号化パラメータを取得する。高帯域背景雑音信号および狭帯域背景雑音信号は第2の高帯域雑音符号化パラメータおよび所定の狭帯域雑音符号化パラメータによって生成される。]
[0030] 理解を容易にするために、異なる側で雑音処理を実行する観点から以下で詳細に議論する。]
[0031] 図2に示す方法では、雑音処理を符号化側で実行する。本発明の第2の実施形態による背景雑音生成方法は、以下を含む。] 図2
[0032] 201:信号フレームを取得する。]
[0033] 本実施形態においては、雑音処理を符号化側で実行するので、信号フレームを符号化側で取得する。]
[0034] 各信号フレームについて、符号化側における入力背景雑音信号sWB(n)をQMF(Quadrature Mirror Filterbank)(H1(z),H2(z))によってフィルタリングして2つのサブバンドを取得し、低サブバンド信号sLB(n)および高サブバンド信号sHB(n)を出力する。]
[0035] まず、低サブバンド信号sLB(n)は729Bと同様の符号化方法によって符号化される。DTXの判断が「送信」であれば、729.1のフレーム長と適合するように、現在のスーパ・フレームの第1の10msフレームを符号化し、狭帯域雑音符号化パラメータPNB_SID=[Ω,E]を取得する。Ωは周波数スペクトラム・パラメータであり、Eは励起エネルギー・パラメータである。]
[0036] 次に、DTXの判断にしたがって、TDBWE(Time-Domain BandWidth Extension)符号器によって高サブバンド信号sHB(n)を符号化する。高帯域雑音符号化パラメータ、すなわち、PWB_SID=[Tenv_SID(i),Fenv_SID(j)]を取得する。Tenv_SID(i)、i=0,…,15は時間エンベロープ・パラメータであり、Fenv_SID(j)、j=0,…,11は周波数エンベロープ・パラメータである。]
[0037] 202:取得した信号フレームが雑音フレームであるか否かを判断し、雑音フレームであれば、ステップ204を実行する。雑音フレームでなければ、ステップ203を実行する。]
[0038] 203:音声フレームの高帯域音声符号化パラメータによって平滑化を実行し、次に、ステップ206を実行する。]
[0039] 符号化側で取得された信号が音声フレームであれば、音声フレームの高帯域音声符号化パラメータによって、第2の高帯域雑音符号化パラメータに平滑化を実行する。詳細な処理は以下のとおりである。]
[0040] 音声フレームの高帯域音声符号化パラメータPWB_SPEECH=[Tenv_SPEECH(i),Fenv_SPEECH(j)]を使用することにより、第2の高帯域雑音符号化パラメータに長期間平滑化(long-term smoothing)を実行するPWB_LONG_SID。Tenv_SID(i)、i=0,…,15は時間エンベロープ・パラメータであり、Fenv_SID(j)、j=0,…,11は周波数エンベロープ・パラメータである。
PWB_LONG_SID=βPWB_LONG_SID+(1−β)PWB_SPEECH]
[0041] βは第2の平滑化パラメータであり、その値は0.5であってよいし、実用的に必要とされる値に決定されてもよい。上記平滑化は時間エンベロープ・パラメータの各々および周波数エンベロープ・パラメータの各々について実行される。すなわち、
Tenv_LONG_SID(i)=βTenv_LONG_SID(i)+(1−β)Tenv_SPEECH(i)
Fenv_LONG_SID(j)=βFenv_LONG_SID(j)+(1−β)Fenv_SPEECH(j)]
[0042] 204:雑音フレームの周波数エンベロープ・パラメータに重み付けを実行する。]
[0043] 符号化側において取得された信号フレームが雑音フレームであるならば、雑音フレームの高帯域雑音符号化パラメータに重み付けを実行する。すなわち、重み付けは高帯域雑音符号化パラメータの周波数エンベロープ・パラメータに実行される。詳細なプロセスは以下のとおりである。]
[0044] Fenv_SID(j)=Fenv_SID(j)*SmoothWindow(j)
重み付けパラメータはSmoothWindow(j)=0.8+0.2*(cos(jπ/12)である。jは周波数値を示し、0〜11までの整数である。jが大きくなるということは周波数値が大きくなるということであり、重み付けの狙いは高周波数部の周波数成分を弱めることである。上記重み付けパラメータは単なる例示であり、実用的なシチュエーションに応じて変更することができる。しかしながら、重み付けパラメータは周波数値に反比例する。]
[0045] 上記iおよびjの値は単なる例示である。実用的な応用において、iおよびjの値は変更されてもよく、特定の値に限定されるものではない。]
[0046] 205:雑音フレームの高帯域雑音符号化パラメータに平滑化を実行する。]
[0047] ステップ204で高帯域雑音符号化パラメータの周波数エンベロープ・パラメータに重み付けを実行した後、最終的に第2の高帯域雑音符号化パラメータを取得するために、ステップ205で、高帯域雑音符号化パラメータの周波数エンベロープ・パラメータおよび時間エンベロープ・パラメータに平滑化を実行してもよい。詳細な処理は以下のとおりである。
PWB_LONG_SID=αPWB_LONG_SID+(1−α)PWB_SID
PWB_SID=PWB_LONG_SID]
[0048] PWB_LONG_SIDは第2の高帯域雑音符号化パラメータである。αは第1の平滑化パラメータであり、その値は0.75である。第1の平滑化パラメータは実用的なシチュエーションにしたがって調整されてもよいが、第1の平滑化パラメータの値は第2の平滑化パラメータの値よりも大きくすべきである。上記平滑化は時間エンベロープ・パラメータの各々および周波数エンベロープ・パラメータの各々に実行される。
Tenv_LONG_SID(i)=αTenv_LONG_SID(i)+(1−α)Tenv_SID(i)
Fenv_LONG_SID(j)=αFenv_LONG_SID(j)+(1−α)Fenv_SID(j)
Tenv_SID(i)=Tenv_LONG_SID(i)
Fenv_SID(j)=Fenv_LONG_SID(j)]
[0049] 206:第2の高帯域雑音符号化パラメータおよび所定の狭帯域雑音符号化パラメータによって信号フレームを組み立て、ステップ201を繰り返し実行する。]
[0050] 第2の高帯域雑音符号化パラメータを取得した後、第2の高帯域雑音符号化パラメータおよび狭帯域雑音符号化パラメータによって無雑音フレームを組み立てる。]
[0051] 207:信号フレームを復号化側に送信する。]
[0052] DTXの現在の判断が「送信」であれば、第2の高帯域雑音符号化パラメータおよび狭帯域雑音符号化パラメータによってSIDフレームを組み立て、復号化側に送信する。DTXの現在の判断が「送信」でなければ、データを付加せずにNODATAフレームを復号化側に送信する。]
[0053] 208:復号化側において復号化を実行することによって背景雑音信号を生成する。]
[0054] 符号化側から送信された信号を復号化側で受信した後、信号フレームを復号化する。詳細な処理は以下を含む。]
[0055] 受信した符号化ビットストリームに狭帯域符号化パラメータだけがあるならば、復号化は729Bと同様の復号化方法によって実行される。符号化パラメータは第1の10msフレームに使用され、第2の10msフレームはNODATAフレームとして処理される。]
[0056] 受信した符号化ビットストリームに広帯域符号化パラメータがあるならば、復号化処理は以下のとおりである。]
[0057] 受信したフレームがSIDフレームであれば、狭帯域雑音符号化パラメータPNB_SID=[Ω,E]と第2の高帯域雑音符号化パラメータPWB_SID=[Tenv_SID(i),Fenv_SID(j)]が復号化を通して取得される。729Bと同様のCNG方法を使用することにより、狭帯域雑音符号化パラメータから狭帯域背景雑音sLB(n)を取得し、729.1と同様のTDBWE復号化方法を使用することにより、第2の高帯域雑音符号化パラメータから高帯域背景雑音sHB(n)を取得する。]
[0058] 受信したフレームがNODATAフレームであれば、狭帯域雑音符号化パラメータは、729Bと同様の復号化方法を使用することにより取得され、次に、狭帯域背景雑音sLB(n)が729Bと同様のCNG方法を使用することにより取得される。前のSIDフレームの高帯域雑音符号化パラメータが現在フレームの高帯域雑音符号化パラメータとして使用される。
PWB=PWB_PRE_SID]
[0059] 729.1のTDBWE復号化方法を使用することにより、高帯域雑音符号化パラメータから高サブバンド背景雑音sHB(n)を取得する。]
[0060] 最後に、最終広帯域背景雑音信号を取得するために、取得した高サブバンド信号sHB(n)および低サブバンド信号sLB(n)を729.1で使用されるOMFによって結合する。このように、復号化側におけるCNGオペレーションによって、最終広帯域背景雑音信号が取得される。]
[0061] 上記処理において、ステップ203は必須のステップではない。すなわち、重み付けおよび/もしくは平滑化は雑音フレームの高帯域雑音符号化パラメータだけに実行されてもよい。復元信号がより平滑でより連続性を有するようになるように、ステップ203を実行することにより、PWB_LONG_SIDに音声フレームの情報を含めてもよい。]
[0062] さらに、ステップ204とステップ205との間に固定された実行順序はない。すなわち、ステップ204はステップ205の前に実行されてもよいし、ステップ205はステップ204の前に実行されてもよい。これらの順序は限定されるものではない。]
[0063] 上記実施形態において、符号化側で、雑音フレームの高帯域雑音符号化パラメータに平滑化を実行した後、および/もしくは、周波数エンベロープに重み付けを実行した後、第2の高帯域雑音符号化パラメータが取得される。この方法において、SIDフレームどうしの間の差異が比較的小さくなるように、復元背景雑音の連続性を向上する。これによれば、「ブロック」効果を効果的に除去することができ、したがって、ユーザ・エクスペリエンスを向上することができる。]
[0064] 次に、音声フレームの高帯域音声符号化パラメータによって、平滑化を第2の高帯域雑音符号化パラメータに実行してもよいので、音声フレームの情報が第2の高帯域雑音符号化パラメータPWB_LONG_SIDに含まれてもよく、これによって、復元信号はより平滑でより連続的になる。]
[0065] 高帯域雑音符号化パラメータが符号化側で処理される場合について上記した。高帯域雑音符号化パラメータが復号化側で処理される場合について以下で議論する。図3に示すように、本発明の第3の実施形態による背景雑音生成方法は以下を含む。] 図3
[0066] 301:信号フレームを符号化側から受信する。]
[0067] 符号化側から送信された信号フレームを復号化側で受信する。信号フレームの生成処理は以下を含む。]
[0068] 入力背景雑音信号sWB(n)を符号化側でフィルタリングし、QMF(H1(z),H2(z))によって2つのサブバンドに分割し、低サブバンド信号sLB(n)および高サブバンド信号sHB(n)を出力する。]
[0069] 次に、低サブバンド信号sLB(n)を、729Bと同様の符号化方法を使用することにより符号化する。DTXの判断が「送信」であれば、729.1のフレーム長と適合するように、現在のスーパ・フレームの第1の10msフレームを符号化し、狭帯域雑音符号化パラメータPNB_SID=[Ω,E]を取得する。Ωは周波数スペクトラム・パラメータであり、Eは励起エネルギー・パラメータである。]
[0070] 次に、DTXの判断にしたがって、高サブバンド信号sHB(n)をTDBWE符号器によって符号化する。高帯域雑音符号化パラメータ、すなわち、PWB_SID=[Tenv_SID(i),Fenv_SID(j)]を取得する。Tenv_SID(i)、i=0,…,15は時間エンベロープ・パラメータであり、Fenv_SID(j)、j=0,…,11は周波数エンベロープ・パラメータである。jが大きくなるということは、対応する周波数が高くなる、ということである。]
[0071] 最後に、2つのサブバンドの符号化パラメータを無雑音フレームに結合する。DTXの現在の判断が「送信」であれば、高帯域雑音符号化パラメータおよび狭帯域雑音符号化パラメータをSIDフレームに組み立て、SIDフレームを復号化側に送信する。DTXの現在の判断が「送信」でなければ、データを付加せずにNODATAフレームを復号化側に送信する。]
[0072] 302:取得した信号フレームが雑音フレームであるか否か判断する。雑音フレームであれば、ステップ304を実行する。雑音フレームでなければ、ステップ303を実行する。]
[0073] 303:音声フレームの高帯域音声符号化パラメータにしたがって平滑化を実行し、次に、ステップ306を実行する。]
[0074] 符号化側で取得した信号フレームが音声フレームであれば、音声フレームの高帯域音声符号化パラメータによって、第2の高帯域雑音符号化パラメータに平滑化を実行する。詳細な処理は以下のとおりである。]
[0075] 第2の高帯域雑音符号化パラメータに音声フレームの高帯域音声符号化パラメータPWB_SPEECH=[Tenv_SPEECH(i),Fenv_SPEECH(j)]を使用することにより長期間平滑化(Long-term smoothing)を実行するPWB_LONG_SID。Tenv_SID(i)、i=0,…,15は時間エンベロープ・パラメータであり、Fenv_SID(j)、j=0,…,11は周波数エンベロープ・パラメータである。
PWB_LONG_SID=βPWB_LONG_SID+(1−β)PWB_SPEECH]
[0076] βは第2の平滑化パラメータであり、その値は0.5であってよく、もしくは、実用的に必要とされる値に決定されてもよい。上記平滑化は時間エンベロープ・パラメータの各々および周波数エンベロープ・パラメータの各々に実行される。すなわち、
Tenv_LONG_SID(i)=βTenv_LONG_SID(i)+(1−β)Tenv_SPEECH(i)
Fenv_LONG_SID(j)=βFenv_LONG_SID(j)+(1−β)Fenv_SPEECH(j)]
[0077] 304:雑音フレームの周波数エンベロープ・パラメータに重み付けを実行する。]
[0078] 復号化側で取得した信号フレームが雑音フレームであれば、雑音フレームの高帯域雑音符号化パラメータに重み付けを実行する。すなわち、高帯域雑音符号化パラメータの周波数エンベロープ・パラメータに重み付けが実行される。処理の詳細は以下のとおりである。
Fenv_SID(j)=Fenv_SID(j)*SmoothWindow(j)]
[0079] 重み付けパラメータはSmoothWindow(j)=0.8+0.2×cos(jπ/12)である。上記jは周波数値を示し、0〜11の整数値であってよい。jが大きいということは、周波数値が大きいということである。重み付けの狙いは、高周波数部の周波数成分を弱めることである。上記重み付けパラメータは単なる例示であり、実用的なシチュエーションに応じて変更されてもよい。しかしながら、重み付けパラメータは周波数値に反比例する必要がある。]
[0080] iおよびjの上記値は単なる例示である。実用的な応用において、iおよびjの値は変更されてもよく、特定の値に限定されない。]
[0081] 305:雑音フレームの高帯域雑音符号化パラメータに平滑化を実行する。]
[0082] ステップ304で高帯域雑音符号化パラメータの周波数エンベロープ・パラメータに重み付けを実行した後、第2の高帯域雑音符号化パラメータを取得するために、高帯域雑音符号化パラメータの周波数エンベロープ・パラメータおよび時間エンベロープ・パラメータに平滑化を実行する必要がある。処理の詳細は以下のとおりである。
PWB_LONG_SID=αPWB_LONG_SID+(1−α)PWB_SID
PWB_SID=PWB_LONG_SID]
[0083] αは第1の平滑化パラメータであり、その値は0.75である。第1の平滑化パラメータの値は実用的なシチュエーションに応じて調整されてもよい。しかしながら、第1の平滑化パラメータの値は第2の平滑化の値よりも大きくすべきである。上記平滑化は時間エンベロープの各々および周波数エンベロープの各々に実行される。すなわち、
Tenv_LONG_SID(i)=αTenv_LONG_SID(i)+(1−α)Tenv_SID(i)
Fenv_LONG_SID(j)=αFenv_LONG_SID(j)+(1−α)Fenv_SID(j)
Tenv_SID(i)=Tenv_LONG_SID(i)
Fenv_SID(j)=Fenv_LONG_SID(j)]
[0084] 306:第2の高帯域雑音符号化パラメータおよび所定の狭帯域雑音符号化パラメータによって信号フレームを組み立て、ステップ301を繰り返し実行する。]
[0085] 実施形態では、729Bと同様のCNG方法を使用することによって狭帯域雑音符号化パラメータから狭帯域背景雑音sLB(n)を取得し、729.1のTDBWE復号化方法を使用することによって第2の高帯域雑音符号化パラメータから高サブバンド背景雑音sHB(n)を取得する。]
[0086] 受信したフレームがNODATAフレームであれば、729Bと同様の復号化方法を使用することによって狭帯域雑音符号化パラメータを取得し、次に、729Bと同様のCNG方法を使用することによって狭帯域背景雑音sLB(n)を取得する。前のSIDフレームの高帯域雑音符号化パラメータを、現在のフレームの高帯域雑音符号化パラメータとして使用する。
PWB=PWB_PRE_SID]
[0087] 次に、729.1のTDBWE復号化方法を使用することによって、高帯域雑音符号化パラメータから高サブバンド背景雑音sHB(n)を取得する。]
[0088] 307:復号化側で復号化を実行することによって背景雑音信号を生成する。]
[0089] 最終広帯域背景雑音を取得するために、取得した高サブバンド信号sHB(n)および低サブバンド信号sLB(n)を、729.1で使用されるQMFによって結合する。このように、復号化側における上記のようなCNGオペレーションによって、最終広帯域背景雑音信号は取得される。]
[0090] 上記処理において、ステップ303は必須のステップではない。すなわち、重み付けおよび/もしくは平滑化は、第2の高帯域雑音符号化パラメータPWB_LONG_SIDを取得するために、雑音フレームの高帯域雑音符号化パラメータだけに実行される。復元信号がより平滑で連続的になるように、ステップ303を実行することによって音声フレームの情報をPWB_LONG_SIDに含めてもよい。]
[0091] さらに、ステップ304とステップ305との実行順序は固定していない。すなわち、ステップ304はステップ305の前に実行されてもよいし、ステップ305はステップ304の前に実行されてもよい。ステップ304およびステップ305の実行順序は限定されない。]
[0092] 上記実施形態において、復号化側で、高帯域雑音符号化パラメータに平滑化を実行し、および/もしくは、雑音フレームの周波数エンベロープに重み付けを実行した後、第2の高帯域雑音符号化パラメータが取得される。SIDフレームどうしの間の差異が比較的小さくなるように、復元背景雑音の連続性を向上する。これによれば、「ブロック」効果を効果的に除去することができ、したがって、ユーザ・エクスペリエンスを向上することができる。]
[0093] 次に、音声フレームの高帯域音声符号化パラメータによって第2の高帯域雑音符号化パラメータに平滑化を実行してもよいので、音声フレームの情報が第2の高帯域雑音符号化パラメータPWB_LONG_SIDに含まれてもよい。これにより、復元信号をより平滑で連続的にすることができる。]
[0094] 図4に示すように、本発明の実施形態の雑音処理装置は以下を含む。
信号フレームを取得するように構成されている信号フレーム取得ユニット401
信号フレームから高帯域雑音符号化パラメータを取得するように構成されているパラメータ取得ユニット402
取得した信号フレームが雑音フレームである場合に、第2の高帯域雑音符号化パラメータを取得するように、高帯域雑音符号化パラメータに重み付けおよび/もしくは平滑化を実行するように構成されているパラメータ処理ユニット403] 図4
[0095] 実施形態において、パラメータ処理ユニット403は、取得した信号フレームが音声フレームである場合、音声フレームの高帯域音声符号化パラメータによって第2の高帯域雑音符号化パラメータに平滑化を実行するように、構成されている。]
[0096] 実施形態において、雑音処理装置は、さらに、以下を含んでもよい。
復号化側に第2の高帯域雑音符号化パラメータを送信するように構成されているパラメータ送信ユニット404]
[0097] 雑音処理装置が符号化側にあれば、雑音処理装置はパラメータ送信ユニット404を備える。]
[0098] 実施形態において、雑音処理装置は、さらに、以下を含んでもよい。
第2の高帯域雑音符号化パラメータによって高帯域背景雑音信号を生成するように構成されている雑音生成ユニット405]
[0099] 雑音処理装置が復号化側にあれば、雑音処理装置は雑音生成ユニット405を備える。]
[0100] 実施形態において、パラメータ処理ユニット403は以下のユニットの少なくとも一方を備える。
重み付けされた周波数パラメータを取得するために所定の重み付けパラメータと高帯域雑音符号化パラメータの周波数エンベロープ・パラメータとを乗じるように構成されている重み付けユニット4031
重み付けパラメータは周波数エンベロープ・パラメータの周波数値に反比例する。
第2の高帯域雑音符号化パラメータを取得するために、所定の第1の平滑化パラメータおよび高帯域雑音符号化パラメータによって計算するように構成されている平滑化ユニット4032
PWB_LONG_SID=αPWB_LONG_SID+(1−α)PWB_SID
PWB_SID=PWB_LONG_SID]
[0101] 上記式において、PWB_LONG_SIDは第2の高帯域雑音符号化パラメータであり、αは第1の平滑化パラメータであり、PWB_SIDは現在の高帯域雑音符号化パラメータである。上記平滑化は雑音フレームの高帯域雑音符号化パラメータについて実行される。もしくは、平滑化ユニット4032は、第2の高帯域雑音符号化パラメータを取得するために、所定の第2の平滑化パラメータおよび高帯域音声符号化パラメータによって計算するように構成されている。
PWB_LONG_SID=βPWB_LONG_SID+(1−β)PWB_SPEECH]
[0102] 上記式において、PWB_LONG_SIDは第2の高帯域雑音符号化パラメータであり、βは第2の平滑化パラメータであり、PWB_SPEECHは現在の高帯域音声符号化パラメータであり、第2の平滑化パラメータは第1の平滑化パラメータより小さい。]
[0103] 上記平滑化は音声フレームに関して高帯域雑音符号化パラメータについて実行される。]
[0104] 各ユニット間の処理の詳細は背景雑音生成方法の上記実施形態の処理と同様であり、ここでは議論しない。]
[0105] 本発明の実施形態において、信号フレームを取得した後、信号フレームが雑音フレームであれば、高帯域雑音符号化パラメータを雑音フレームから取得し、雑音フレームによって重み付けおよび/もしくは平滑化を高帯域雑音符号化パラメータに実行する。すなわち、平滑化を高帯域雑音符号化パラメータに実行し、および/もしくは、重み付けを周波数エンベロープに実行した後、復元背景雑音の連続性は向上する。これにより、SIDフレームどうしの間の差異は比較的小さくなる。このことは効果的に「ブロック」効果を除去し、これにより、ユーザ・エクスペリエンスを向上することができる。]
[0106] 本方法の上記実施形態のステップのすべてもしくは部分は関連するハードウェアで実行されるプログラム命令によって実施してもよい。プログラムはコンピュータ読取可能記憶媒体に記憶されてもよい。プログラムは以下のステップを実行する。
取得した信号フレームが雑音フレームであれば、高帯域雑音符号化パラメータを雑音フレームから取得する。
第2の高帯域雑音符号化パラメータを取得するために、重み付けおよび/もしくは平滑化を高帯域雑音符号化パラメータに実行する。
第2の高帯域雑音符号化パラメータによって高帯域背景雑音信号を生成する。]
[0107] 上記記憶媒体はROM(Read Only Memory)、磁気ディスク、光ディスクなどであってよい。]
[0108] 本発明による背景雑音生成方法および雑音処理装置についての詳細な議論を上記した。本発明の原理から逸脱することなく、特定の実施形態に様々な変更を行うことができる。したがって、上記議論の内容は本発明の範囲を限定するものとして解釈されるべきではない。]
[0109] 本出願は、2008年3月20日に中国特許庁に出願した中国特許出願第200810085177.0号(発明の名称:「背景雑音生成方法および雑音処理装置」)を基礎として優先権を主張する。本出願および中国特許出願第200810085177.0号の出願人は同一であり、中国特許出願第200810085177.0号の内容をあらゆる目的のために参照によって本願明細書に組み込む。]
权利要求:

請求項1
取得された信号フレームが雑音フレームである場合、高帯域雑音符号化パラメータを該雑音フレームから取得し、第2の高帯域雑音符号化パラメータを取得するために前記高帯域雑音符号化パラメータに重み付けおよび平滑化の少なくとも一方を実行し、前記第2の高帯域雑音符号化パラメータによって高帯域背景雑音信号を生成する、背景雑音生成方法。
請求項2
取得されたた信号フレームが音声フレームである場合、該音声フレームから高帯域音声符号化パラメータを取得し、前記音声フレームの高帯域音声符号化パラメータによって前記第2の高帯域雑音符号化パラメータに平滑化を実行する、請求項1に記載の方法。
請求項3
前記高帯域雑音符号化パラメータは時間エンベロープ・パラメータおよび周波数エンベロープ・パラメータを含み、前記第2の高帯域雑音符号化パラメータを取得するために前記高帯域雑音符号化パラメータに重み付けを実行することは、重み付けされた周波数エンベロープ・パラメータを取得するために前記周波数エンベロープ・パラメータと所定の重み付けパラメータとを乗じ、前記重み付けパラメータは前記周波数エンベロープ・パラメータの周波数値に反比例し、前記第2の高帯域雑音符号化パラメータとして前記重み付けされた周波数エンベロープ・パラメータを含む高帯域雑音符号化パラメータを使用する、ことをさらに含み、前記第2の高帯域雑音符号化パラメータを取得するために前記高帯域雑音符号化パラメータに平滑化を実行することは、前記第2の高帯域雑音符号化パラメータを取得するために、PWB_LONG_SID=αPWB_LONG_SID+(1−α)PWB_SIDによって所定の第1の平滑化パラメータおよび高帯域雑音符号化パラメータを用いて計算する、ことをさらに含み、PWB_LONG_SIDは前記第2の高帯域雑音符号化パラメータであり、αは前記第1の平滑化パラメータであり、PWB_SIDは現在の高帯域雑音符号化パラメータである、請求項2に記載の方法。
請求項4
前記重み付けされた周波数エンベロープ・パラメータを取得するために前記周波数エンベロープ・パラメータと所定の重み付けパラメータとを乗じることは、Fenv_SID(j)=Fenv_SID(j)×SmoothWindow(j)によって、前記周波数エンベロープ・パラメータと重み付けパラメータとを用いて計算することをさらに含み、SmoothWindow(j)=0.8+0.2×cos(jπ/12)であり、Fenv_SID(j)は前記周波数エンベロープ・パラメータであり、SmoothWindow(j)は前記重み付けパラメータであり、jは周波数値を示し、jは該周波数値に比例し、jの値は0〜11のいずれかの整数値である、請求項3に記載の方法。
請求項5
前記音声フレームの高帯域音声符号化パラメータによって第2の高帯域雑音符号化パラメータに平滑化を実行することは、前記第2の高帯域雑音符号化パラメータを取得するために、PWB_LONG_SID=βPWB_LONG_SID+(1−β)PWB_SPEECHによって所定の第2の平滑化パラメータと高帯域音声符号化パラメータとを用いて計算することをさらに含み、PWB_LONG_SIDは前記第2の高帯域雑音符号化パラメータであり、βは前記第2の平滑化パラメータであり、PWB_SPEECHは現在の高帯域雑音符号化パラメータであり、前記第2の平滑化パラメータは前記第1の平滑化パラメータよりも小さい、請求項3または4に記載の方法。
請求項6
前記信号フレームは符号化側もしくは復号化側で取得され、前記信号フレームが前記符号化側で取得される場合、前記第2の高帯域雑音符号化パラメータを取得するために高帯域雑音符号化パラメータに重み付けおよび平滑化の少なくとも一方を実行した後、前記第2の高帯域雑音符号化パラメータを含む信号フレームを前記復号化側に送信する、ことをさらに含む、請求項3または4に記載の方法。
請求項7
信号フレームを取得するために構成されている信号フレーム取得ユニットと、前記信号フレームから高帯域符号化パラメータを取得するために構成されているパラメータ取得ユニットであって、該信号フレームが雑音フレームである場合、該高帯域符号化パラメータは高帯域雑音符号化パラメータである、パラメータ取得ユニットと、取得された前記信号フレームが雑音フレームである場合、第2の高帯域雑音符号化パラメータを取得するために前記高帯域雑音符号化パラメータに重み付けおよび平滑化の少なくとも一方を実行するように構成されているパラメータ処理ユニットと、前記第2の高帯域雑音符号化パラメータによって高帯域背景雑音信号を生成するように構成されている雑音生成ユニットと、を備える雑音処理装置。
請求項8
前記パラメータ取得ユニットによって取得される高帯域符号化パラメータは、前記信号フレームが音声フレームである場合、高帯域音声符号化パラメータであり、前記パラメータ処理ユニットは、取得された前記信号フレームが音声フレームである場合、該音声フレームの高帯域音声符号化パラメータによって前記第2の高帯域雑音符号化パラメータに平滑化を実行するように、さらに、構成されている、請求項7に記載の雑音処理装置。
請求項9
復号化側に前記第2の高帯域雑音符号化パラメータを送信するように構成されている請求項7または8に記載の雑音処理装置。
請求項10
前記パラメータ処理ユニットは、重み付けユニットと平滑化ユニットとの少なくとも一方を備え、前記重み付けユニットは、重み付けされた周波数エンベロープ・パラメータを取得するために、前記高帯域雑音符号化パラメータの周波数エンベロープ・パラメータと所定の重み付けパラメータとを乗じるように構成されており、前記重み付けパラメータは前記周波数エンベロープ・パラメータの周波数値に反比例し、前記平滑化ユニットは、第2の高帯域雑音符号化パラメータを取得するために、PWB_LONG_SID=αPWB_LONG_SID+(1−α)PWB_SIDによって所定の第1の平滑化パラメータと高帯域雑音符号化パラメータとを用いて計算するように構成されており、PWB_SID=PWB_LONG_SIDであり、PWB_LONG_SIDは前記第2の高帯域雑音符号化パラメータであり、αは前記第1の平滑化パラメータであり、PWB_SIDは現在の高帯域雑音符号化パラメータであるか、もしくは、前記平滑化ユニットは、第2の高帯域雑音符号化パラメータを取得するために、PWB_LONG_SID=βPWB_LONG_SID+(1−β)PWB_SPEECHによって所定の第2の平滑化パラメータと高帯域音声符号化パラメータとを用いて計算するように構成されており、PWB_LONG_SIDは前記第2の高帯域雑音符号化パラメータであり、βは前記第2の平滑化パラメータであり、PWB_SPEECHは現在の高帯域音声符号化パラメータであり、前記第2の平滑化パラメータは前記第1の平滑化パラメータよりも小さい、請求項7または8に記載の雑音処理装置。
类似技术:
公开号 | 公开日 | 专利标题
JP6400790B2|2018-10-03|Signal encoding and decoding method and apparatus
US9478227B2|2016-10-25|Method and apparatus for encoding and decoding high frequency signal
JP6035356B2|2016-11-30|Audio signal processing during high frequency reconstruction
JP2017078870A|2017-04-27|フレームエラー隠匿装置
US9111532B2|2015-08-18|Methods and systems for perceptual spectral decoding
RU2607262C2|2017-01-10|Устройство и способ для воспроизведения аудиосигнала, устройство и способ для генерирования кодированного аудиосигнала, компьютерная программа и кодированный аудиосигнал
JP5253565B2|2013-07-31|合成されたスペクトル成分に適合するようにデコードされた信号の特性を使用するオーディオコーディングシステム
JP5208901B2|2013-06-12|音声信号および音楽信号を符号化する方法
ES2237706T3|2005-08-01|Reconstruccion de componentes de alta frecuencia.
JP6558745B2|2019-08-14|符号化/復号化方法および符号化/復号化デバイス
RU2413191C2|2011-02-27|Системы, способы и устройства для устраняющей разреженность фильтрации
RU2449386C2|2012-04-27|Способ и устройство для аудиодекодирования
KR101586317B1|2016-01-18|신호 처리 방법 및 장치
JP5539573B2|2014-07-02|Sbrビットストリームパラメータダウンミックス
ES2328649T3|2009-11-16|Metodo y dispositivo para realizar una ocultacion de tramas borradas en una señal de banda superior.
ES2453098T3|2014-04-04|Códec multimodo de audio
RU2585999C2|2016-06-10|Генерирование шума в аудиокодеках
JP6360165B2|2018-07-18|Apparatus and method for generating an adaptive spectral shape of comfort noise
KR100608062B1|2006-08-02|오디오 데이터의 고주파수 복원 방법 및 그 장치
RU2419171C2|2011-05-20|Способ переключения скорости передачи битов при аудиодекодировании с масштабированием скорости передачи битов и масштабированием полосы пропускания
US9224399B2|2015-12-29|Apparatus and method for concealing frame erasure and voice decoding apparatus and method using the same
TWI498882B|2015-09-01|音訊解碼器
CN1997988B|2010-11-03|在音频编码过程中根据mdct数据进行视窗类型判定的方法
US7386445B2|2008-06-10|Compensation of transient effects in transform coding
JP5047268B2|2012-10-10|Mdct係数を使用する音声後処理
同族专利:
公开号 | 公开日
CN101483495B|2012-02-15|
KR20100133437A|2010-12-21|
EP2254111A1|2010-11-24|
CN101483495A|2009-07-15|
EP2254111B1|2015-10-28|
KR101248535B1|2013-04-03|
US20110010167A1|2011-01-13|
JP5143949B2|2013-02-13|
ES2557898T3|2016-01-29|
WO2009115036A1|2009-09-24|
US8494846B2|2013-07-23|
EP2254111A4|2011-04-06|
引用文献:
公开号 | 申请日 | 公开日 | 申请人 | 专利标题
JPH0946233A|1995-07-31|1997-02-14|Kokusai Electric Co Ltd|音声符号化方法とその装置、音声復号方法とその装置|
JP2004512562A|2000-10-18|2004-04-22|ノキア コーポレーション|広帯域音声コーデック復号器における高周波拡張階層符号化|
JP2002196799A|2000-12-26|2002-07-12|Mitsubishi Electric Corp|音声符号化装置及び音声符号化方法|
JP2004077961A|2002-08-21|2004-03-11|Oki Electric Ind Co Ltd|音声復号装置|
WO2006008932A1|2004-07-23|2006-01-26|Matsushita Electric Industrial Co., Ltd.|音声符号化装置および音声符号化方法|
JP2009545788A|2006-08-04|2009-12-24|ティーエスエックスインコーポレイテッドTsxInc.|フェイルオーバシステムおよび方法|
JP2010518453A|2007-02-14|2010-05-27|マインドスピードテクノロジーズインコーポレイテッド|Embedded silence and background noise compression|
JP2010520513A|2007-03-05|2010-06-10|テレフオンアクチーボラゲットエルエムエリクソン(パブル)|定常的な背景雑音の平滑化を制御するための方法及び装置|
JP2011512563A|2008-02-19|2011-04-21|シーメンスエンタープライズコミュニケーションズゲゼルシャフトミットベシュレンクテルハフツングウントコンパニーコマンディートゲゼルシャフトSiemensEnterpriseCommunicationsGmbH&Co.KG|Method and means for encoding background noise information|JP2015507764A|2011-12-30|2015-03-12|華為技術有限公司Huawei Technologies Co.,Ltd.|オーディオ・データを処理するための方法、装置、及びシステム|
JP2016218464A|2011-02-18|2016-12-22|株式会社Nttドコモ|音声復号装置、音声符号化装置、音声復号方法、及び音声符号化方法|WO2000034944A1|1998-12-07|2000-06-15|Mitsubishi Denki Kabushiki Kaisha|Decodeur sonore et procede de decodage sonore|
US6324505B1|1999-07-19|2001-11-27|Qualcomm Incorporated|Amplitude quantization scheme for low-bit-rate speech coders|
EP1959435B1|1999-08-23|2009-12-23|Panasonic Corporation|Speech encoder|
US7353168B2|2001-10-03|2008-04-01|Broadcom Corporation|Method and apparatus to eliminate discontinuities in adaptively filtered signals|
US7155386B2|2003-03-15|2006-12-26|Mindspeed Technologies, Inc.|Adaptive correlation window for open-loop pitch|
CN101087319B|2006-06-05|2012-01-04|华为技术有限公司|一种发送和接收背景噪声的方法和装置及静音压缩系统|
WO2008032828A1|2006-09-15|2008-03-20|Panasonic Corporation|Audio encoding device and audio encoding method|JP3634134B2|1997-09-10|2005-03-30|富士通株式会社|サスペンション、ヘッドスライダ支持装置、及びディスク装置|
EP2686846A4|2011-03-18|2015-04-22|Nokia Corp|Apparatus for audio signal processing|
CN105210148B|2012-12-21|2020-06-30|弗劳恩霍夫应用研究促进协会|用以在低比特率下模型化背景噪声的舒缓噪声添加技术|
EP2980790A1|2014-07-28|2016-02-03|Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V.|Apparatus and method for comfort noise generation mode selection|
CN105721656B|2016-03-17|2018-10-12|北京小米移动软件有限公司|背景噪声生成方法及装置|
法律状态:
2012-05-23| A131| Notification of reasons for refusal|Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120522 |
2012-08-23| A601| Written request for extension of time|Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20120822 |
2012-08-30| A602| Written permission of extension of time|Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20120829 |
2012-09-25| A521| Written amendment|Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120924 |
2012-10-19| TRDD| Decision of grant or rejection written|
2012-10-24| A01| Written decision to grant a patent or to grant a registration (utility model)|Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121023 |
2012-10-25| A01| Written decision to grant a patent or to grant a registration (utility model)|Free format text: JAPANESE INTERMEDIATE CODE: A01 |
2012-11-29| A61| First payment of annual fees (during grant procedure)|Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121121 |
2012-11-30| FPAY| Renewal fee payment (event date is renewal date of database)|Free format text: PAYMENT UNTIL: 20151130 Year of fee payment: 3 |
2012-11-30| R150| Certificate of patent or registration of utility model|Ref document number: 5143949 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
2015-11-10| R250| Receipt of annual fees|Free format text: JAPANESE INTERMEDIATE CODE: R250 |
2016-11-01| R250| Receipt of annual fees|Free format text: JAPANESE INTERMEDIATE CODE: R250 |
2017-11-07| R250| Receipt of annual fees|Free format text: JAPANESE INTERMEDIATE CODE: R250 |
2018-11-06| R250| Receipt of annual fees|Free format text: JAPANESE INTERMEDIATE CODE: R250 |
2019-11-05| R250| Receipt of annual fees|Free format text: JAPANESE INTERMEDIATE CODE: R250 |
2020-10-30| R250| Receipt of annual fees|Free format text: JAPANESE INTERMEDIATE CODE: R250 |
2021-10-29| R250| Receipt of annual fees|Free format text: JAPANESE INTERMEDIATE CODE: R250 |
优先权:
申请号 | 申请日 | 专利标题
[返回顶部]